Chargement des librairies

Chargement des données brutes

Transformation

  • Transformation log2 centré et mise à l’échelle interquartile pour CPMG et NOESY
  • Transformation CLR pour OTU (log et centré = center log ratio)
    cf code html métabo

Diablo sur données tabagique

Design de matrice = 0 car pas d’apriori sur les données

## $NOESY
## [1] 846  84
## 
## $OTU
## [1] 846 997
##   1   2   3 
## 168 442 236
##       NOESY OTU
## NOESY     0   0
## OTU       0   0

Tuning the number of components

Diablo_total

Diablo_total

D’après le graph, le taux d’erreur (ER :error rate ) et le taux d’erreur global équilibré/moyenné (BER : balanced error rate) est minimale soit à 3 composantes pour ER soit à 10 composantes avec BER.La distance max semble donner une meilleure précision.

D’après la fonction choice.ncomp :

Considering this distance and the BER, the output $choice.ncomp indicates an optimal number of components for the final DIABLO model. Il s’avère que c’est 1 probablement du à un écart type plus petit. Cependant nous allons prendre 4 dimensions

Simulation du KeepX

Si test effectué sur données assignées avec:
- Noesy et CPMG +OTU alors Noesy et CPMG =1 OTU sur ncomp= 4, 15 rep OTU = 12,2,75,1
- Noesy+OTU=rep20 Noesy ; 40 55 40 40 18 18 8 3 2 1 et OTU :95 35 105 75 1 16 2 1 1 6

## Design matrix has changed to include Y; each block will be
##             linked to Y.
##       NOESY OTU Y
## NOESY     0   0 1
## OTU       0   0 1
## Y         1   1 0

Diablo sur données Sex

## $NOESY
## [1] 846 215
## 
## $CPMG
## [1] 846 202
## 
## $OTU
## [1] 846 997
##   1   2 
## 433 413
##       NOESY CPMG OTU
## NOESY   0.0  0.9   0
## CPMG    0.9  0.0   0
## OTU     0.0  0.0   0

##Tuning the number of components

Diablo_total

Diablo_total

D’après le graph, le taux d’erreur (ER :error rate ) et le taux d’erreur global équilibré/moyenné (BER : balanced error rate) diminue à 1 et/ou 4 composantes.La distance max semble donner une meilleure précision.

D’après la fonction choice.ncomp :

Considering this distance and the BER, the output $choice.ncomp indicates an optimal number of components for the final DIABLO model. Il s’avère que c’est 1 probablement du à un écart type plus petit. Cependant nous allons prendre 4 dimensions

Test KeepX


Quelque soit les tests réalisés avec les composantes de 4 ou 7 avec des valeurs tests de keepx c(1:9, seq(10, 18, 2), seq(20,50,5), seq(55,105,10)) et 50 répétitions nous obtenons les valeurs suivantes: noesy et CPMG toujours = 1,1,1,1 OTU variable mais dans ce cas =14,2,1,1

## Design matrix has changed to include Y; each block will be
##             linked to Y.
##       NOESY CPMG OTU Y
## NOESY   0.0  0.9   0 1
## CPMG    0.9  0.0   0 1
## OTU     0.0  0.0   0 1
## Y       1.0  1.0   1 0

rCCA Regularized Canonical Correlation Analysis

## [1] 846 215
## [1] 846 997